公开人脸识别数据集

您所在的位置:网站首页 人脸图片 识别 公开人脸识别数据集

公开人脸识别数据集

2023-06-19 18:44| 来源: 网络整理| 查看: 265

1. FaceMask CelebA数据集

FaceMask CelebA是模拟的口罩人脸数据集,粘贴的人脸蒙版图像(RGBA)从从网上下载,裁剪完面部的最小区域后,将其粘贴到相应的位置。FaceMask_CelebA数据集中,包括 202599 张口罩人脸图像和人脸bbox标签。

应用项目:人脸检测

URL: https://github.com/sevenHsu/FaceMask_CelebA

2. Flicker-Faces-HQ数据集

Flickr-Faces-HQ数据集是高质量的人脸图像数据集,主要目的为训练生成对抗网络(GAN)模型。数据集在年龄,种族和图像背景方面均存在很大差异,此外,还覆盖了诸如眼镜,太阳镜,帽子等附件。图像是从Flickr抓取的,从而继承了该网站的所有偏见,并使用dlib算法自动对齐和裁剪。Flickr-Faces-HQ数据集包含70000张分辨率为1024×1024的高质量PNG图像。

应用项目:人脸生成

URL:https://github.com/NVlabs/ffhq-dataset

3. Make up数据集

Make up数据集为了研究人脸化妆,对面部识别的影响而汇总的女性面部图像的数据集。主要收集了4个数据集:

(1)YMU(YouTube化妆):人脸图像是从YouTube视频化妆教程中获得的。

(2)VMU(虚拟化妆):对FRGC存储库(http://www.nist.gov/itl/iad/ig/frgc.cfm)中白人女性的面部图像,经过合成获得,从而实现模拟化妆的效果。

(3)MIW:从互联网上抓取已经化妆、和没有化妆的人脸面部图像。

(4)MIFS(化妆诱发的面部欺骗):从YouTube视频化妆教程中获取对象的面部图像,并从互联网上获取相关目标对象的面部图像。

不同类型的数据集,数量各不相同。

应用项目: 人脸美妆

URL:Makeup datasets

4. VoxCeleb数据集

VoxCeleb数据集是一个视听数据集,包含人类语音的简短剪辑,摘录自上传到YouTube的采访视频。VoxCeleb数据集包含来自不同种族,口音,专业和年龄的700位演讲者的演讲。所有说话的脸部表情都被抓取,并带有背景聊天,笑声,重叠语音,姿势变化和不同的照明条件。此外,在时长上,VoxCeleb数据集包含2000个小时的音频和视频,每个片段至少3秒长。

应用项目:说话人识别、情绪识别、人脸生成

URL:VoxCeleb

5. Anime-Face-Dataset数据集

Anime-Face-Dataset中的动漫人脸,全都来自高质量动画的网站www.getchu.com,然后使用动画面部检测算法https://github.com/nagadomi/lbpcascade_animeface,对人脸进行检测,并缩放到90*90-120*120大小。

应用项目:人脸生成

URL:https://github.com/bchao1/Anime-Face-Dataset

6. Generated Faces数据集

Generated Faces数据集是一个用于多样化的合成数据集,需要注意的是,此数据集并不可以直接下载,而是根据自己的需要进行购买下载,可以按照下方类型进行定制:

(1)可自定义的背景:彩色,透明,摄影

(2)多样性:种族,人口统计学,面部表情和头部姿势

应用项目:生成人脸,情绪识别、人脸识别

URL:https://generated.photos/datasets#

7. RMFD口罩人脸数据集

在疫情期间,基于口罩人脸数据,设计相应的口罩遮挡人脸检测和识别算法,帮助社区封闭时的人员进出管控,车站,机场的人脸识别闸机以及人脸门禁考勤设备的升级,成为一种需要。RMFD口罩人脸数据集,共汇总了多种口罩人脸数据,可以用来做人脸检测和人脸识别算法的训练。RMFD口罩人脸数据集中,包含多种口罩人脸数据。

(1)真实口罩人脸识别数据集:从网络爬取样本,经过整理,清洗和标注后,含525人的5千张口罩人脸,9万正常人脸。

(2)模拟口罩人脸识别数据集:给公开数据集中的人脸戴上口罩,得到1万人,50万张人脸的模拟口罩人脸数据集。

(3)真实口罩人脸验证数据集:包括426个人的4015张人脸图像,组合成3589对相同身份和3589对不同身份的人脸样本对(口罩人脸/正常人脸)。

应用项目:人脸检测、人脸识别

URL:https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset

8. Glint360K数据集

Glint360K是格灵深瞳开源,通过清理,合并和发布最大和最干净的面部识别数据集。Glint360K数据集,包含360232个人的17091657张图片

应用项目:人脸识别

URL:https://github.com/deepinsight/insightface/tree/master/recognition/partial_fc#glint360k

9. Celebrity in Places数据集

Celebrity in Places数据集包含不同类型场景,以及不同的名人。这些图像全部是使用Google图像搜索获得的,并通过人工注释进行了验证。

比如第一张图片的标签为:阿曼达●塞弗里德-机场航站楼

第二张图片的标签为:大卫●卡梅隆-宴会厅

数据集包含不同类型场景中约36k名人的图像。有4611位名人和16个地方参与其中。

应用项目:人脸识别、场景分类

URL:https://www.robots.ox.ac.uk/~vgg/data/celebrity_in_places/

10. Public Figures Face人脸数据集

从互联网收集的人脸数据集。包括 200 个人的 58797 张图像。同一人的图像具有不受控的参数环境,包括不同的姿势、光照、场景、镜头、摄像参数等。

应用项目:人脸识别

URL:http://www.cs.columbia.edu/CAVE/databases/pubfig/

11. NIST Mugshot Identification人脸数据集

国家标准及技术研究所发布的人面部自动化识别测试数据。包含 1573位个人(男1495、女78), 3248张 面部照片,照片包括正脸照和侧脸照。其中131人有一张以上正脸照,1418人只有一张正脸照。89人有一张以上侧脸照,1268人只有一张侧脸照。

应用项目:人脸识别

URL:https://www.nist.gov/srd/nist-special-database-18

12. Caltech 10k Web Faces人脸数据集

人脸图像数据,来自Google图像搜索后的人工标注。包含 10524张 人脸图像和标注信息,标注眼睛、鼻子和嘴巴的位置,并且在不同的设置中,例如,肖像图像,人群等。

应用项目:人脸检测、人脸对齐

URL:http://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/

13. IMDB-WIKI 500k跨年龄人脸数据集

包含名人人脸图像、年龄、性别的数据集,图像和年龄、性别信息从 IMDB 和 WiKi 网站抓取。总计 524230 张名人人脸图像及对应的年龄和性别。其中,获取自 IMDB 的 460723 张,获取自 WiKi 的 62328 张。

应用项目:人脸识别、年龄识别

URL:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

14. 300 Face in Wild人脸检测数据集

一个人脸识别和轮廓标注数据,该数据及也是机器视觉等级会议 ICCV 2013 人脸检测竞赛所使用的数据集。

应用项目:人脸检测

URL:https://ibug.doc.ic.ac.uk/resources/300-W/

15. Facial-keypoints人脸关键点数据集【Kaggle竞赛】

人脸关键点标定竞赛,为图像中的人脸标定15个关键位置点,图像时96x96像素的,每个关键点对应一个二维位置坐标用以标识关键点的位置。

应用项目:人脸对齐

URL:https://www.kaggle.com/c/facial-keypoints-detection

16. MegaFace人脸识别数据库

最大的公开面部识别数据集,所有数据都是华盛顿大学从 Flickr(雅虎旗下图片分享网站)组织收集的。包含一百万张图片,代表 690000 个独特的人。

应用项目:人脸识别

URL:http://megaface.cs.washington.edu/dataset/download.html

17. Wider-Face人脸检测数据集

人脸检测基准数据集,主要用于身份鉴定, 2016 年由香港中文大学的 Yang,Shuo and Luo,Ping and Loy,Chen Change and Tang,Xiaoou 收集发布。它包含 32203 个图像和 393703 个人脸图像,在尺度,姿势,闭塞,表达,装扮,关照等方面表现出了大的变化。该数据集基于 61 个事件类进行组织。对于每个事件类,随机选择了 40%/ 10%/ 50%的数据作为培训,验证和测试集。

应用项目:人脸检测

URL:http://shuoyang1213.me/WIDERFACE/

18. IJB-B 数据集

美国国家标准化研究院(NIST)发布的大型人脸数据集,包括从互联网采集的静态人脸图像和视频。共有1845个对象,11754张图片,55026视频帧,7011个视频和10044非人脸图像。该数据集在采集上与其它流行的人脸数据集不重叠,如:牛津大学VGG人脸数据集Face Challenge、CASIA WEBFace数据集等。数据集被用于NIST举办的 Face Challenge 竞赛,进行校验、搜索、检测、聚类、标注等人脸识别任务。

应用项目:人脸聚类、人脸识别

URL:https://www.nist.gov/programs-projects/face-challenges

19. MS-Celeb-1M数据集

MSR IRC是目前世界上规模最大、水平最高的图像识别赛事之一,由MSRA(微软亚洲研究院)图像分析、大数据挖掘研究组组长张磊发起,每年定期举办。从1M个名人中,根据他们的受欢迎程度,选择100K个。然后,利用搜索引擎,给100K个人,每人搜大概100张图片。共100K*100=10M个图片,测试集包括1000个名人,这1000个名人来自于1M个明星中随机挑选。而且经过微软标注。每个名人大概有20张图片,这些图片都是网上找不到的。

应用项目:人脸识别,人脸检测

URL:https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/

20. Casia-webface数据集

2014年中科院发布,收集了10000多个名人的照片。包含453453幅人脸图像的数据集,经人脸检测后共识别出超过10575个身份,然而,这些照片是在网上用爬虫扒下来的,所以有一些数据存在问题,这里对这个数据集做清洗

应用项目:人脸识别

 URL:http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html

21. LFW数据集

人脸图片均通过 Viola-Jones 人脸检测算法从互联网上检索搜集。包含 13000 张从互联网上获取的人脸图像,每张图片都标有该人的姓名,其中有 1680 个人的有超过2张图像,共有四个子数据集,分别为 原始数据集(lfw)、funneled images、LFW-a、deep funneled images 四组。

 应用项目:人脸识别

URL:http://vis-www.cs.umass.edu/lfw/



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3